来源丨OSC开源社区(ID:oschina2013)
作者丨Travis
文末送书!!!
「PDF 补丁丁」是开发者 @wmjordan 所开发的一款适用于 Windows 系统的多功能 PDF 文档工具箱,开发者最早于 2009 年开始了该程序的开发,如今已有十二年历史,也算是国内知名的老牌 PDF 工具。此前该软件免费供用户使用,但并没开源。
在 2019 年,开发者在发布 0.6.2 测试版后曾表示该版本将会是 PDF 补丁丁的最后一个版本,未来将不再更新。2021 年 8 月,在时隔两年后开发者又重新开始了该软件的后续开发工作。在 2021 年 12 月中旬,开发者透露将以开源的形式发布 1.0 版本,此前该软件的版本号也一直停留在 0.6.2。近日开发者 @wmjordan 在 GitHub 平台正式开放了 PDF 补丁丁的源代码(除第三方组件外),供有心人学习 PDF 文档处理技术之用。PDF 补丁丁具有的功能和特性包括:修改 PDF 文档、PDF 书签编辑器、制作 PDF 文件、拆分或合并 PDF 文件、高速无损导出 PDF 文档的图片、将 PDF 页面转换为图片、提取或删除 PDF 文档中指定的页面,调整 PDF 文档的页面顺序、根据 PDF 文档元数据重命名、调用微软 Office 的图像识别引擎分析 PDF 文档图片中的文字、替换字体、分析文档结构、永久免费,无广告,不窥探隐私等;Windows 7 以上版本的操作系统;
.NET Framework 4.0 到 4.8 版本;
使用文字识别功能需要安装 Microsoft Office 2003(或 2007)的 Document Imaging 组件(MODI);
如需编译程序源代码,建议使用 Visual Studio 2019 或更新版本,并安装 “.NET 桌面开发” 和 “C++ 桌面开发” 两个工作负载;
项目源代码已托管至 GitHub(https://github.com/wmjordan/PDFPatcher),感兴趣的开发者可前往项目地址提交 PR 或 issue。end
关注公众号👇👇👇留言的朋友均有机会获得书籍呦~今日书单 | 包邮送推荐理由:本书由浅入深、图文并茂地介绍了Python机器学习方面的相关内容,并通过150多个实际案例,手把手地教会读者掌握用Python语言进行机器学习相关项目开发的方法与技巧。书中包含Python语言基础内容、机器学习、人工智能、TensorFlow、Keras、OpenCV等相关API的使用方法,给出的每个案例都可以单独运行,可进行二次开发。
推荐理由:本书以300个不同类型的案例引导初学者快速入门,全面掌握Python语言编程技巧。这些案例各具特色,容易上手,趣味性强,学习效率高。本书内容涵盖字符串处理、包与模块管理、变量名称空间、代码流程控制、数学运算、面向对象编程、常用数据结构、异步编程、网络编程、文件与I/O、Tk组件与应用程序界面开发。推荐理由:本书在一个通用的概念框架中描述通用于数据挖掘、机器学习和生物信息学等领域的重要思想和概念。这些统计学范畴下的概念是人工智能与机器学习的基础。全书共18 章,主题包括监督学习、回归的线性方法、分类的线性方法、基展开和正则化、核光滑方法、模型评估和选择、模型推断和平均、加性模型、树和相关方法、Boosting 和加性树、神经网络、支持向量机和柔性判断、原型方法和最近邻、非监督学习、随机森林、集成学习、无向图模型和高维问题等。推荐理由:本书介绍Spark应用开发的面向对象和函数式编程概念,讨论RDD和DataFrame基本抽象,讲述如何使用SparkSQL、GraphX和Spark来开发可扩展的、容错的流式应用程序,介绍监控、配置、调试、测试和开发等高级主题。通过本书的学习,你将能使用SparkR和PySpark API开发Spark应用程序,使用Zeppelin进行交互式数据分析,使用Alluxio进行内存数据处理,将透彻理解Spark,并能对海量数据执行全栈数据分析,终成为数据科学家。
活动规则:我们将从关注我们的精选留言中随机抽取 12名 小伙伴赠书,中奖者可在上方书单中任选一本图书,我们包邮赠送。书籍有限,中奖后先选先得。《Python机器学习(微课视频版)手把手教你掌握150个精彩案例》 *6
《Python实战指南——手把手教你掌握300个精彩案例》 *2
《统计学习要素:机器学习中的数据挖掘、推断与预测(第2版)》 *2
《Scala和Spark大数据分析 函数式编程、数据流和机器学习(大数据应用与技术丛书)》 *2
留言要求:
截止时间: 2021 年 01 月 19 日 16:00 整兑奖时间: 2021 年 01 月 21 日 16:00截止
每天 17:30 不见不散!